Der Bereich " Parallel and Distributed Computing" evaluiert, beschafft und betreibt Supercomputer und hochkapazitäre on-line Speichersysteme für aufwändige wissenschaftliche Simulationen und Datenanalysen.

Einführung

Das ZIB betreibt leistungsfähige Rechnersysteme als Teil des Nationalen Hochleistungsrechnens (NHR). HPC-Fachberater aus unterschiedlichen Wissenschaftsgebieten wie der Chemie und den Materialwissenschaften, den Erd- und Ingenieurwissenschaften, den Lebenswissenschaften, der Physik und Informatik unterstützen dabei die Wissenschaftler bei der Nutzung des Rechnersystems. Insbesondere helfen die Fachberater den Wissenschaftlern zu Fragen der effizienten Ausnutzung der vorhandenen Rechenressourcen sowie bei der Verwaltung und Analyse großer Datenmengen, damit die innovativen wissenschaftlichen Forschungsvorhaben erfolgreich umgesetzt werden können.

Der Rechenkomplex "Lise" am NHR@ZIB

Der Rechenkomplex „Lise“, bestehend aus Partitionen mit CPU- und GPU-Rechenknoten, ist das vom NHR@ZIB betriebene Tier-2 HPC-System. Neben seiner Rechenleistung verfügt das Rechnersystem über eine on-line Speicherkapazität von 20 Petabytes. Für die Langzeitarchivierung von Daten kann ein Bandarchiv mit mehreren Bandrobotern in einem speziell geschützten Raum genutzt werden.

Der Rechenkomplex “Lise” in der Übersicht:

NHR Rechenkomplex "Lise" am ZIB

Hochvolumige Speicherkapazitäten für HPC und KI-Anwendungen

Heute benötigen die komplexen Berechnungsverfahren mit Prä- und Postprocessing sowie KI-Anwendungen on-line Speicher mit großen Kapazitäten im Petabyte-Bereich. Selbst mit modernen Methoden der Kopplung von Simulation und on-the-fly Analysen müssen für die Ein- und Ausgabedaten eines einzelnen Rechenjobs auf dem "Lise"-System bis zu einigen Terabytes Speicherkapazität vorgehalten werden.

Mit der Konvergenz von Rechnerarchitekturen für HPC und Anwendungen der KI ist die Bereitstellung von hochkapazitären Speichersystemen mit optimalen Datenzugriffen bedeutend für jetzige und künftige Anwendungen.

Speicherinfrastruktur des Rechenkomplexes "Lise" im Überblick:

  • 20 PByte on-line Speicherkapazität, davon 1 PByte in einem SSD-Cache, stehen in einem global verfügbaren, parallelen Dateisystem (Storage Scale) zur Verfügung; es erlaubt einen Datenzugriff mit hoher Bandbreite auf Nutzerdaten.
  • 0,5 PByte on-line Speicherkapazität stehen im Distributed Asynchronous Object Storage (DAOS), einem Experimentalsystem mit innovativer Speicherarchitektur zur Verfügung.
  • mehrere PByte stehen in einem Bandarchiv für die Langzeitarchivierung zur Verfügung (betrieben als zentrale Ressource vom ZIB).